Swisscom 的 TensorFlow 自定义模型 — 通过文本分类改善业务运营
文 / Mostafa Ajallooeian、Athanasios Giannakopoulos (Swisscom)
电信服务提供商 Swisscom 不断收到来自客户的书面查询,内容通常涉及账单查询、地址等客户数据变更、合约套餐或互联网访问等产品支持。在针对每个查询执行操作之前,Swisscom 的分类团队首先会将查询分类,以便妥善地分组和处理请求。然而,由于客户表达意图的方式多种多样,他们提出的大多数查询都过于复杂,而无法自动分类。因此,无论是基于规则的方法,还是现有的机器学习解决方案都无法解决这一问题,因为这些方法落下太多未能发现的细节。
Swisscom 意识到,其需要借助平台,以使用各种方法构建深度自定义的机器学习模型。经过探索后,我们确定 TensorFlow 及其易于使用的 Keras API 将能填补现有解决方案未解决的空白。因此,Swisscom 数据科学家于 2016 年学习并采用了 TensorFlow 的开源机器学习平台。
然后,数据科学家团队使用 tf.keras 进行初始测试,随后进行集成并创建更大的架构。Swisscom 使用 GPU 构建基于传统构建基块的自定义模型,然后使用 Tensorboard 监控每个模型的每日进度。我们严重依赖混合多种神经模块(例如全连接层 (FC)、卷积 (CNN)、循环细胞 (RNN))的自定义架构。我们发现,从各种元素组合中获得的信息是影响最终性能的主要驱动因素,而哪个组合能成为最佳组合则取决于问题。通过使用 TensorFlow,Swisscom 能够构建一个可部署的有效系统,解决在分类通过电子邮件和聊天收到的客户查询时面临的两个最大问题。
聊天意图和电子邮件分类
Swisscom 部署的基于 TensorFlow 的解决方案现在可以对聊天对话中的客户意图快速分类(聊天类别不断发展,现在已有 40 多个类别)。通过分析简短的查询(与短信长度相当或更短),该模型能够确定客户的意图是变更其 SIM 卡、修改电话合约或征求产品建议,以及许多其他可能性。
此外,Swisscom 还使用自动路由技术传送电子邮件。这种通信类型可以传输更加丰富的内容,从而能够区分更多类别的数量级。电子邮件也更加多样化,从自动回复发展到包含一行内容的文本,再到一页文本。电子邮件路由模型规模很大,内含超过 100 万个参数,拥有两个卷积层和两个全连接层。此模型还可用于自动回复的迁移学习,并且曾针对 0.5M 数据点进行训练,内容包括电子邮件文本和元数据。
此解决方案的成果前景广阔,因为电信行业通常将客户服务外包给一些海外地区,英语通常是这些地区的第二语言,而使用 TensorFlow 在内部操作所实现的分类准确率比这种标准方法提高 10%。至于电子邮件分类,收益则更高,达到 22%。您可以前往 research.swiscom.ai 了解详情。
更多 AI 相关阅读: